Анализ рынка общественного питания Москвы

Содержание проекта

Описание проекта

Инвесторы задумали расширить сферу своей деятельности и открыть в Москве заведение общественного питания. Для этого им необходимо исследование рынка Москвы, чтобы понять, где лучше всего расположить кофейню и какие цены будут оптимальными. Также им потребуется презентация, в которой будут изложены основные аспекты исследования.

Цель проекта

Подготовить исследование рынка общественного питания Москвы, найти интересные особенности и презентовать полученные результаты, которые в будущем помогут в выборе подходящего инвесторам места для открытия заведения общественного питания.

Описание данных

Доступен датасет(moscow_places.csv) с заведениями общественного питания Москвы, составленный на основе данных сервисов Яндекс Карты и Яндекс Бизнес на лето 2022 года.

Описание столбцов в датасете moscow_places.csv:

План работ

  1. Чтение и изучение данных
  2. Предобработка данных
  3. Анализ данных
  4. Детализирование исследование для открытия кофейни
  5. Рекомендации по открытию кофейни
  6. Презентация

Чтение и изучение данных

Установим необходимые библиотеки

Промежуточный вывод

Предобработка данных

Видим, очень странный минимальный средний счет, а именно 0 рублей, такого быть не может, изучим подробнее. Также видим очень высокую стоимость чашки капучино(1568 рублей) и высокий средний счет(35000 рублей)

В кофемании на новом Арбате средний счет не может быть от 0 рублей, а в кафе на Каширском шоссе средний счет не может быть 35 000 рублей, так как это кафе при больнице, можно сказать столовая. Также стоимость чашки капучино в Шоколаднице на Большой Семёновской не может быть 1568 рублей. Остальные данные похожи на реальность. Заполним столбец среднего счета и стоимости чашки капучино пропуском.

Для всех несетевых заведений с одинаковым названием верно, указан параметр chain == 0

Обработка пропусков

Мы видим, что пропуски присутствуют в 6 столбцах:

Большинство столбцов с пропусками имеют более 50% пропусков. Всего около 27 тысяч пропусков. Далее попробуем восстановить данные.

Так как названия сетевых заведения, с параметром chain == 1, не повторяются с обычными названиями, то мы можем для сетевых заведений найти пропущенные данные, так как в большинстве сетевых заведениях цены, средние чеки и время работы совпадают.

Создадим функцию для заполнения пропусков сетевых заведений с одинаковыми параметрами, а именно название и район. По названию и/или району будем группировать данные и пересечение только с 2 уникальными значениями(NaN и известное) будем использовать для заполнения пропусков.

После заполнение пропусков, общее кол-во пропусков уменьшилось примерно на ~2,5 тысячи

Дополнительные столбцы

Добавим отдельный столбец с названием улицы. Исключением станут адресса с МКАД, для них мы добавим название дороги и номер километра.

Добавим отдельный столбец, где будет указано работает ли заведение 24/7.

Промежуточный вывод

Анализ данных

Распределение заведений по категориям

Промежуточный вывод: В датасете представленные данные о заведениях из 8 категорий:

Количество посадочных мест в категориях по заведениям

Промежуточный вывод:

Соотношение сетевых и несетевых заведений

Промежуточный вывод:

В датасете присутсвует 5201 несетевое заведение и 3204 сетевых заведений. Сетевых заведений довольно много, это может быть связанно с тем, что для сетевых заведений рынок Москвы хорошо изучен и понятен, поэтому им не так сложно масштабироваться. Кроме того, Москва огромный мегаполис, а место работы, жизни и отдыха человека, может находиться в разных концах города, и человеку часто проще зайти в знакомое сетевое заведение, чем искать новое.

Топ-15 сетей общественного питания по размеру

Промежуточный вывод

Распределение заведений по районам

Промежуточный вывод

Распределение средних рейтингов по категориям заведений

Промежуточный вывод:

Карта со всеми заведениями и средним рейтинга по округам

Промежуточный вывод

Топ-15 улиц по кол-ву заведений

Также посмотрим на карте на улицы и заведения на них

Промежуточный вывод

Улицы только с одним заведением

Промеуточный вывод

Влияние расстояние от центра города на медианну среднего чека по округам

Для лучшего понимания зависимости среднего чека от центра, сделать хитмеп на карте. Для создания хитмепа, нужно создать новый Geojson с нужными параметрами, для это создадим функцию.

Промежуточный вывод

Медианая цена среднего чека самая высокая в ЦАО на всей его площади. В остальных же округах медианный средний более разнообразный, это видно на хитмепе карты, он может быть любым(низкой, средней, высокой и очень высокой).В связи с этим, можем сделать предположение, что для всех округов, кроме ЦАО, медианный средний чек больше зависит от других факторов, чем от расстояния до центра.

Вывод

Детализирование исследование для открытия кофейни

Распределение кофеен по районам

Промежуточный вывод

Особенности расположения кофеен

Создадим функцию, которая будет считать сколько кофеен находиться рядом с кофейней в заданом расстояние

Создадим функцию, которая находит расстояние до ближайщей кофейни

Расстояний до ближайщей кофейни

Создадим таблицу и график, где отобразим соотношение расстояний до ближайщих кофеин по округам. Также посмотрии на среднее и медианное расстояние до кофеен

Промежуточный вывод

Кол-во ближайщих кофеен

Посмотрим, со сколькими кофейнями соседствует каждая кофейня в радиусе 100м, 250м и 500м по округам.

Промежуточный вывод В ЦАО, ЗАО, СВАО и САО кофейни соседствуют с самым большим количеством кофеен в радиусе 100м, 250м и 500м. Это может свидетельствовать о том, что там присутвуют районы интереса, где на небольшом расстояния могут быть собраны сразу несколько кофеен.

Количество кофеен на 1 км²

Создадим карту-хитмеп, где отобразим кол-во кофеен на примерно 1 км².

Промежуточный вывод

Круглосуточные кофейни

Промежуточный вывод Круглосуточных кофеен очень мало(~4.4%). Это означает, что спрос на них совсем невысокий, следовательно при открытие кофейни режим работы 24/7 не обязательный.

Рейтинг кофеен

Промежуточный вывод

Стоимость чашки капучино

Промежуточный вывод

Рекомендации по установке цены будут данны далее.

Соотношение сетевых и несетевых кофеен

Промежуточный вывод

Вывод

При анализе кофеен мы учитываем то, что кофеен в Москве достаточно, а сам рынок кофеен уже сформирован и устоявшийся в большинстве случаев.

Распределение кофеен по районам:

Особенности расположения кофеен:

Промежуточный вывод:

Круглосуточные кофейни:

Рейтинг кофеен:

Стоимость чашки капучино:

Соотношение сетевых и несетевых кофеен:

Рекомендации по открытию кофейни

Самые интересеные округа для открытия кофейни это ЦАО, САО и ЗАО

Презентация

Презентация исследования с ключевыми моментами в формате PDF: